Analyse exploratoire d'opinions cinématographiques : co-clustering de corpus textuels communautaires

نویسندگان

  • Damien Poirier
  • Cécile Bothorel
  • Marc Boullé
چکیده

Résumé. Les sites communautaires sont un endroit privilégié pour s’exprimer et publier des opinions. Le site www.flixster.com est un exemple de site participatif sur lequel se rassemblent plus de 20 millions de cinéphiles qui partagent des commentaires sur les films qu’ils ont ou non aimés. Explorer les contenus autoproduits est un challenge pour qui veut comprendre les attentes des internautes. Par une méthode d’apprentissage non supervisée, nous montrerons qu’il est possible de mieux comprendre le vocabulaire utilisé pour décrire des opinions. En particulier, grâce à une méthode de co-clustering, nous montrerons qu’un rapprochement peut être fait entre des films particuliers sur la base de l’usage d’un vocabulaire particulier. L’analyse des résultats peut conduire à retrouver une certaine typologie de films ou encore des rapprochements entre films. Cette étude peut être complémentaire avec des analyses linguistiques des corpus, ou encore être exploitée dans un contexte applicatif de recommandation de contenus multimédias.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Marqueurs de la relation cause-effet : stabilité et variation dans des corpus de nature différente

Résumé : Les marqueurs lexicaux figurent parmi les indicateurs les plus intéressants pour identifier et classer finement des relations terminologiques. Cependant, l’exploitation des marqueurs pour repérer automatiquement ou semi-automatiquement les relations dans des corpus, notamment des corpus associés à des domaines ou à des genres textuels différents, peut soulever des problèmes. Le présent...

متن کامل

Analyse et visualisation d'opinions dans un cadre de veille sur leWeb

Résumé. L’analyse d’opinions est une tâche qui consiste en l’identification et la classification de textes subjectifs. Dans ce travail, nous nous intéressons au problème d’analyse d’opinions dans un contexte de veille sur le Web. Nous proposons une approche pour visualiser les résultats d’analyse d’opinions, basée sur l’utilisation de termes clés. Nous décrivons également la plateforme de veill...

متن کامل

La Classification non Supervisée (Clustering) de Documents Textuels par les Automates Cellulaires

Résumé : Dans cet article nous présentons un automate cellulaire (Class_AC) pour résoudre un problème de text mining en l’occurrence la classification non supervisée (Clustering). Avant de procéder à l’expérimentation par l’automate cellulaire, nous avons vectorisés nos données en procédant à l’indexation des documents textuels provenant de la base de donnée REUTERS 21578 par l’approche Wordnet...

متن کامل

TB/HIV Co-Infection Care in Conflict-Affected Settings: A Mapping of Health Facilities in the Goma Area, Democratic Republic of Congo

Background HIV/AIDS and Tuberculosis (TB) are major contributors to the burden of disease in sub-Saharan Africa. The two diseases have been described as a harmful synergy as they are biologically and epidemiologically linked. Control of TB/HIV co-infection is an integral and most challenging part of both national TB and national HIV control programmes, especially in contexts of instability wher...

متن کامل

Textual Data Clustering and Cluster Naming

In this paper we present the research a way of clustering textual data based on the thematics approached in the texts and a manner of finding a suitable, humanly readable name for each group. Previous research done on the field of data clustering and thematic extraction is briefly presented, along with observations of their suitability for the intended purpose, and then we propose an approach t...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008